llm动漫_第3页

LLM的关键转折：LAM，究竟是什么？

操作 Windows 程序、自动对账发票、预订航班和酒店——这些只是新一代大型语言模型（LLMs）为 AI 智能体带来的众多可能性中的几个。研究人员将这一阶段的进化称为“大型行动模型（Large Action Models）”，简称 LAMs。

智能体 llm rpa gui lam 2025-06-25 14:40 9

7B模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM

这个方法要求教师模型像优秀的人类教师一样，根据已知解决方案输出清晰的逐步解释，而不再是从头开始自己解决。

模型教师推理 llm 推理llm 2025-06-25 14:13 11

群核科技SpatialLM技术解析：基于LLM的3D结构化建模新范式

近日，空间理解模型SpatialLM发布首份技术报告，该模型来自于空间智能公司群核科技。据悉，该模型于今年3月正式开源，并在开源后迅速与DeepSeek-V3、Qwen2.5-Omni一起登上全球最大的开源社区HuggingFace全球趋势榜前三。

llm 建模科 spatiallm spatiallm技术 2025-06-24 10:51 11

OpenAI 前大神颠覆性演讲：软件3.0时代到来

近期，前特斯拉AI总监、OpenAI创始成员Andrej Karpathy在YC AI Startup School的演讲可谓是火爆科技圈。他以《Software in the era of AI》为演讲主题，结合了自己在特斯拉、OpenAI和斯坦福的工作经验

软件 openai llm 演讲 cursor 2025-06-23 20:30 11

读创今日荐书 | 如何理解大模型底层技术？

全书分为三部分，依次介绍语言模型的原理、应用及优化。第一部分“理解语言模型”，解析语言模型的核心概念，包括词元、嵌入向量及Transformer架构，帮助读者建立基础认知。第二部分“使用预训练语言模型”，介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成

模型 llm 荐书杰伊多斯特 2025-06-23 20:34 8

从零开始200行python代码实现LLM

本文尝试从零开始，用python实现一个极简但完整的大语言模型，在过程中把各种概念“具象化”，让大家亲眼看到、亲手写出self-attention机制、transformer模型，亲自感受下训练、推理中会遇到的一些问题。

代码 llm python idx python代码 2025-06-20 19:35 10

大模型火了之后，这本书更像圣经了

在这个到处是大模型和深度学习的时代，很多人都开始怀疑，传统的强化学习方法是不是已经过时了。但 Sutton 的回应恰恰说明了一个核心问题：你越是在“黑盒”盛行的年代，越需要掌握最基本的原理。

模型 llm gym rl 圣经 2025-06-21 12:31 8

大模型为何难成为「数学家」？

数学证明不仅要得出 “对” 的答案，更要给出逻辑闭合、层层严谨的推理过程。在不等式问题中尤其如此 —— 哪怕最终答案是对的，只要中间某一步出现纰漏，整个证明就可能不成立。我们不禁提问：这些答案是模型通过严密推理得出的，还是只是通过 “看起来合理” 的过程猜出来

模型 gemini 推理 llm 数学证明 2025-06-22 20:53 7

舍弃CUDA编程！CMU等用几十行代码将LLM编译成巨型内核，推理延迟可降6.7倍

机器之心报道编辑：杜伟在 AI 领域，英伟达开发的 CUDA 是驱动大语言模型（LLM）训练和推理的核心计算引擎。不过，CUDA 驱动的 LLM 推理面临着手动优化成本高、端到端延迟高等不足，需要进一步优化或者寻找更高效的替代方案。近日，CMU 助理教授贾志豪

推理 llm cmu cuda cuda编程 2025-06-21 17:20 9

OpenAI 超级智能路径遭质疑，Meta 研究员称基于 LLM 强化学习行不通

“构建超级智能不过是个工程问题。”2023 年，OpenAI 首席执行官山姆・奥特曼（Sam Altman）曾这样表示。这似乎暗示着 OpenAI 的研究人员已然知晓构建超级智能的可行路径，只待投入时间与精力搭建所需系统。

meta openai llm meta研究员 llm强化 2025-06-21 14:34 6

MIT 研究揭示长期使用ChatGPT辅助写作，可能引发认知能力严重下降

当学生们越来越习惯用 ChatGPT 辅助完成论文写作时，一项来自 MIT 的最新研究为我们敲响了警钟。这项长达 206 页的研究通过脑电图（EEG）监测和认知分析发现，使用大型语言模型（LLM）如 ChatGPT 进行写作任务，会导致用户认知负债的累积，长期

llm 写作 chatgpt mit 认知能力 2025-06-21 14:12 9

从“中国市场”到“中国定义”

最近，一只有着圆眼睛、尖耳朵、长着獠牙的小精灵火遍全球，她就是由泡泡玛特出品的潮玩产品LABUBU。在被HelloKitty、Bearbrick等海外IP主导了几十年的潮玩市场，中国品牌正在慢慢成为一股不可忽视的力量。

llm 潮玩玛特 labubu rce 2025-06-20 17:30 8

企业级语言模型自托管优秀实践

大型语言模型（LLMs）随处可见，从日常应用到高级工具都可以看到他们的身影。虽说使用起来很容易，但如果要运行自己的模型就是另外一回事了。比如对模型进行微调并处理了一些隐私敏感数据，复杂性就会增加。在这篇文章中，我们将分享在构建我们自己的 LLM 推理系统时所学

模型 llm 语言 rabbitmq sse 2025-06-20 17:23 8

使用AI写作导致认知退化（MIT的可怕发现）

研究设计包括三个组别(LLM组、搜索引擎组和纯大脑组)，通过四个会话观察不同工具对写作的影响。

llm 写作 mit 石化 eeg 2025-06-20 00:06 10

AI Agent 安全警钟敲响：风险凸显

在当今数字化浪潮汹涌的时代，人工智能技术以前所未有的速度蓬勃发展，AI Agent（人工智能智能体）作为其中的前沿应用，正逐渐走进人们的生活与工作。它不再仅仅是简单的智能对话程序，而是具备了看听读写、执行具体任务的强大能力，宛如一位不知疲倦的数字助手，为人们带

llm agent aiagent mcp 警钟 2025-06-18 05:03 9

GTC 巴黎 | 调用 LLM：全新 NVIDIA AI Blueprint 推动电信网络配置自动化

例如，电信公司必须基于时段、用户行为、移动性和流量类型，不断调整网络参数以完成各类任务，比如将通话从一个网络转接至另一个网络，或在多台服务器间分配网络流量。

llm nvidia aiblueprint gtc 2025-06-17 18:36 8

dify 1.4.3版本深度解析：全面优化与功能增强指南

2025年6月16日，dify发布了全新版本v1.4.3。此次更新重点围绕系统稳定性提升、功能完善以及用户体验优化展开，涵盖了LLM节点增强、插件支持拓展、界面交互改进等多个方面。本文将为您全面解读dify 1.4.3版本的更新内容、升级指南和具体改进措施，助

llm 插件 compose dify oceanbase 2025-06-17 13:40 7

MCP客户端调用看这一篇就够了（Java版）

MCP协议的初衷是希望能将大模型的工具调用来做统一，对于 MCP 的原理介绍的文章已经随处可见，相信大家都有自己的见解，这里简单介绍一些没有MCP之前的痛点问题，帮助大家理解为何需要MCP。

客户端 llm java mcp mcp客户端 2025-06-12 11:30 10

中科院团队自研大模型，自动设计超强芯片

处理器芯片设计技术是推动计算机科学及相关领域突破的关键前沿技术。随着信息技术的快速发展，传统的设计范式面临三大挑战：制造技术的物理约束、日益增长的设计资源需求以及生态系统的日益多样化。自动化处理器芯片设计已成为应对这些挑战的变革性解决方案。尽管人工智能（AI）

模型芯片 llm 中科院 lpcm 2025-06-12 09:33 9

RL+search = Deep research

我之前说过chatGPT的deepresearch 做的好是因为它的DR 引擎是o3强化版本的针对过search场景RFT过，所以体验比grok和google的DR要好，后两者更像deep search或者说我们用的更像deep search

rag llm rl deepresearch ppo 2025-05-11 23:53 11